1. 简介
在日常开发中我们经常会批量操作数据,因此很多高级语言除了提供数组,还给我们提供很多高级的、抽象的数据类型来让我们处理批量数据时得心应手。由于这些轮子对于程序的性能是比较关键的轮子,因此很多语言都内置的提供了比较精致的实现。在java
中,这种实现被称为集合框架。集合框架包含的接口、类十分丰富,而且功能强大,因此理解并熟悉java
集合框架,对于写出正确高效的程序是十分有必要的。java
集合框架中包含两个重要的类LinkedHashMap
与HashMap
,它们常常被用于按key-value
存储、操作数据,对于常见的操作都是常数的时间复杂度,因此被广泛使用,虽然这两个类的作用类似,但是他们的实现和使用场景稍微不同。
2. 二者的区别
HashMap
与LinkedHashMap
都实现了Map
接口,二者的存储形式都是采用bucket
加链表的形式来进行存储的。二者的主要区别:
HashMap
由于是按照key
的hash
值映射到对应的bucket
中,无法保证遍历HashMap
时的顺序是预期的顺序LinkedHashMap
在HashMap
的基础上加以改进,却可以保证遍历的顺序要么是插入item
的顺序或者LRU
访问的顺序
这是因为LinkedHashMap
维护了一个双向链表来记录数据插入的顺序,因此在迭代遍历生成的迭代器的时候,是按照双向链表的路径进行遍历的。
如果选择LRU
访问的顺序,LinkedHashMap
对于访问过的item
会将其移动到双链表的末尾,这样保证最近访问过的item
是处于链表末端,因此较老其不经常使用的item
会处于链表前端。这个特性恰好符合LRU
的思想,因此LinkedHashMap
可以用来实现LRU Cache
。Android
提供的SDK
的LruCache
类便是利用LinkedHashMap
实现了基于Lru
规则的缓存功能。
另外可以发现在java8
中HashMap
和LinkedHashMap
有了改动,据说在某些Hash
碰撞严重时,性能也不会太差。java8
之前的Map
实现的问题是当出现某个bucket
的后面的链表太长了,也就是说发生hash
冲突的item
太多了,这样会导致访问操作退化到了O(n)
。
java8
的改进便是当bucket
的链表长度大于阈值的时候,会将链表重新组织为一颗红黑树,这样在hash
碰撞严重的时候性能还是可以保证到log(n)
.改进前后的示意图如下所示:
在使用LinkedHashMap
和HashMap
的时候应该注意Key
的hash
值是怎么取得,如果不同的key
经常出现相同的hash值,则会频繁出现冲突,降低性能。
同时,由于改进后的HashMap
会在某个bucket
后的链表长度超过某个阈值时,重新将连边组织为一颗红黑树,因此在java8
上的key
最好实现Comparable
接口来保证key
是可以通过compareTo
进行比较的,因为这样会简化建立红黑树的判断流程,提高效率。当然如果不实现Comparable
接口的话,也会有相应的方法保证hash
值冲突的item
形成一颗平衡的红黑树。
3. 源码阅读
此处选取几个关键的地方进行源码分析:
- 对于
HashMap
重点关注这几个方法
1 | final void treeifyBin(Node<K,V>[] tab, int hash) |
1 | public V put(K key, V value) |
1 | final void treeify(Node<K,V>[] tab) |
1 | static int tieBreakOrder(Object a, Object b) |
1 |
|
1 |
|
1 |
|
1 | /** |
1 |
|
以上部分简要的分析了HashMap
的改进处的源码。
- 对于
LinkedHashMap
,主要阅读分析其如何保证迭代的顺序、具有LRU的性质LinkedHashMap
是HashMap
的子类,只是稍加改造便使得其具有链表的顺序性质。1
2
public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V>
1 |
|
主要关注以下几个方法:
1 | Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) |
1 | private void linkNodeLast(LinkedHashMap.Entry<K,V> p) |
1 |
|
1 |
|
1 |
|
1 | //这个方法是HashMap的hook方法,只是简单的扩展了HashMap的Node类,就完成了LinkedHashMap的大部分功能 |
1 | /** |
1 | // link at the end of list |
由于LinkedHashMap
没有重写put
方法,因此它复用了HashMap
的put
方法,只是简单重写了hook
方法newNode
。因此put
方法不用分析了。到此应该就可以去看迭代器的实现了,讲道理的话应该是按照双向链表的顺序来迭代的。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
abstract class LinkedHashIterator {
LinkedHashMap.Entry<K,V> next;
LinkedHashMap.Entry<K,V> current;
int expectedModCount;
LinkedHashIterator() {
next = head;//head存放的是双向链表的表头
expectedModCount = modCount;
current = null;
}
public final boolean hasNext() {
return next != null;
}
final LinkedHashMap.Entry<K,V> nextNode() {
LinkedHashMap.Entry<K,V> e = next;
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
if (e == null)
throw new NoSuchElementException();
current = e;
next = e.after;//依次迭代
return e;
}
}
自此已经大致清楚了LinkedHashMap
是如何简单的改造了HashMap
而拥有了顺序的迭代。
LinkedHashMap
不仅仅遍历是有序的,而且还可以选择是何种顺序,是插入顺序还是访问顺序。
acceeOrder
的定义了遍历是何种顺序,该值默认是false
,若想为true
,需要显示的指定。
1 |
|
这样无论是put
还是get
操作都会导致该元素e
会被放在链表尾部。这样链表表头部分的元素的访问时间就相对久远了,这个特性就恰恰比较符合LRU
的思想。因此当LinkiedHashMap
的元素个数超过一定的阈值时(因为缓存的容量是有限的),就需要删除某些缓存item
了。在LinkedHashMap
中就有这样的CallBack
来完成这个目的。
1 |
|
LinkedHashMap
默认是不移除老元素,因此要实现Lru需要重写该方法。1
2
3
4
protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
return false;
}
通常会这么重写1
2
3
4
5private static final int MAX_ENTRIES = 100;
protected boolean removeEldestEntry(Map.Entry eldest) {
return size() > MAX_ENTRIES;
}
可以看出来LinkedHashMap
只是稍微加以改进,就具备了额外的功能。这种类的设计十分精致,值得借鉴。HashMap
预留了几个关键的hook
方法给扩展类(此处是LinkedHashMap
),例如newNode()
,afterAccess()
afterInsertion()
等。这样就是策略和机制分离了,便于扩展类添加更丰富的功能。当然我们也可以按照需要扩展HashMap
,从而改变其某些行为。
但是HashMap
类中的TreeNode
怎么会去继承子类LinkedHashMap
的Entry
,难道仅仅是为了少些几行代码?我觉得这个设计不是很好。毕竟父类不应该去获取子类的某些信息,有点本末倒置。
1 | /** |
4. Best Practices
在使用
HashMap
时应该尽量保证key
的hashCode
返回值分布均匀性;在java8上使用时key
应该尽量实现comparable
接口。LinkedHashMap
和HashMap
性能的比较:在基本的put
get
remove
操作,两者的性能几乎相近,由于LinkedHashMap
维护着一个双向链表,因此性能可能稍微差一点点。但是在迭代遍历的时候,因为LinkedHashMap
遍历的所有的插入的元素,而HashMap
是遍历的整个HashMap
(包括一些空桶),因此LinkedHashMap
的性能稍微优于HashMap
。LinkedHashMap
可以保持任意的Map
的顺序信息,就像这样使用:
1
2
3
4
5
void foo(Map m) {
Map copy = new LinkedHashMap(m);
...
}